Rank in Wordlist | Frequency | Word |
---|---|---|
205 | 70677 | из-за |
524 | 32612 | что-то |
888 | 21344 | пресс-служба |
985 | 19110 | кто-то |
1059 | 17982 | Иссык-Кульской |
1192 | 16232 | Премьер-министр |
1200 | 16089 | пресс-службе |
1305 | 14944 | пресс-конференции |
1471 | 13610 | премьер-министр |
1535 | 13104 | все-таки |
1664 | 12231 | какой-то |
1730 | 11753 | как-то |
1777 | 11476 | Джалал-Абадской |
1828 | 11163 | какие-то |
1845 | 11087 | премьер-министра |
1999 | 10352 | Из-за |
2203 | 9446 | по-прежнему |
2243 | 9303 | Иссык-Куль |
2513 | 8392 | где-то |
2520 | 8374 | вице-премьер-министр |
Rank in Wordlist | Frequency | Word |
---|---|---|
2520 | 8374 | вице-премьер-министр |
6395 | 3342 | Вице-премьер-министр |
9021 | 2336 | вице-премьер-министра |
11457 | 1789 | Рио-де-Жанейро |
12935 | 1556 | Би-би-си |
24868 | 720 | вице-премьер-министром |
36663 | 434 | Республика-Ата-Журт |
40075 | 385 | Ростове-на-Дону |
40148 | 384 | Бишкек-Нарын-Торугарт |
41618 | 365 | Би-Би-Си |
Rank in Wordlist | Frequency | Word |
---|---|---|
134324 | 63 | Туркменистан-Афганистан-Пакистан-Индия |
159792 | 48 | экс-вице-премьер-министр |
159793 | 48 | экс-вице-премьер-министра |
208348 | 30 | TBegin-->TEnd-->В |
231169 | 25 | 4-2-3-1 |
233065 | 25 | Экс-вице-премьер-министр |
271910 | 19 | Мырзаке-Кара-Кулжа-Алайкуу |
272459 | 19 | Россия-Казахстан-Кыргызстан-Таджикистан |
278819 | 18 | TBegin-->TEnd-- |
279003 | 18 | Ала-Бука-Каныш-Кыя |
Rank in Wordlist | Frequency | Word |
---|---|---|
208348 | 30 | TBegin-->TEnd-->В |
278819 | 18 | TBegin-->TEnd-- |
279961 | 18 | Китай-Кыргызстан-Таджикистан-Афганистан-Иран |
307845 | 15 | TBegin-->TEnd-->Компания |
319584 | 14 | ThumbBegin-->ThumbEnd-->В |
323206 | 14 | Ташкент-Андижан-Ош-Иркештам-Кашгар |
383739 | 10 | Балыкчи-Тамчы-Чолпон-Ата-Корумду |
405339 | 9 | Ала-Бука-Жаны-Базар-Кировка |
462092 | 7 | TBegin-->TEnd-->На |
502602 | 6 | Балыкчы-Тамчы-Чолпон-Ата-Корумду |
Some languages allow the formation of longer word by composition using hyphens. Moreover, proper names may contain hyphens. Therefore we look for the most frequent words containing 1, 2, 3 or 4 hyphens.
Usually we find interesting words. But in the case of poor preprocessing there may be unexpected strings resulting from hyphenation etc. Words ending with an hyphen are usually not welcome, too.
For three hyphens:
select w_id-100,freq, word from words where word like "%-%-%-%" limit 10;
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots
3.12.4 Words containing special characters